Una de las plataformas de streaming más concurridas y famosas actualmente es Twitch, con su crecimiento exponencial ha traído a miles de streamers de todo el mundo. A su vez, mediante diferentes variables (Total de seguidores, promedio de views o el promedio total transmitido) se ven afectadas por factores como el idioma (región) o la categoría de sus videos (Just Chatting, IRL, juegos).
El problema en nuestro estudio se centra en la falta de comparativa entre dos de las comunidades más importantes en Twitch, la angloparlante (Inglés) y la hispanohablante (Español), y es importante para llegar a conclusiones en el tema de popularidad, y visualizar el comportamiento de los oyentes identificar a los streamers, contenido y juegos más famosos y concurridos por región.
Comparar el comportamiento de las categorías de contenido de los streamers de habla angoparlante (Inglés) y hispanohablante (Español), para determinar y diferenciar las preferencias y/o comportamientos de los oyentes.
Limpiar el data frame .csv, inspeccionar las columnas para identificar los valores nulos o vacíos para garantizar unos resultados precisos y correctos.
Definir el top 5 de los streamers de habla angoparlante más populares en seguidores, views, dentro de las categorías de contenido más concurridas.
Definir el top 5 de los streamers de habla hispanohablante más populares en seguidores, views, dentro de las categorías de contenido más concurridas.
Comparar los resultados obtenidos entre ambas comunidades para identificar las diferencias y similitudes en el comportamiento de los oyentes.
Este estudio está basado en Twitch, la plataforma de Streaming más concurrida en esta era a nivel mundial. Sus inicios en 2011 como una rama de Justin.tv, para retransmitir contenido en vivo. Debido a la enorme popularidad de la sección de videojuegos en Justin.tv, decidieron crear Twitch.tv como una plataforma dedicada exclusivamente a los eSports y videojuegos, lanzándose oficialmente el 6 de junio de 2011. La plataforma creció rapidamente, volviendose la más popular en la categoría de Videojuegos, con el tiempo, evolucionó a otras categorías, como Just Chatting, IRL (in real life, streams en la calle), conciertos, deportes.
En esta investigación, nos apoyamos en la Estadística Descriptiva para obtener los resumenes y tener los datos en orden. Con esto, podemos presentar las características principales de los datos (medias, máximos y distribuciones de frecuencia), permitiendo así comparar la distribución de las preferencias y el comportamiento de los oyentes entre ambas comunidades, identificando los patrones específicos de consumo y popularidad.
La investigación es de naturaleza Cuantitativa de tipo descriptivo con un énfasis comparativo. Se busca recopilar y analizar datos númericos de Twitch para describir el comportamiento de cada variable y comparar los resultados entre sí.
La fuente de datos a utilizar es twitch_streamers.csv, y
las variables más importantes para esta investigación son
NAME, LANGUAGE,
MOST_STREAMED_GAME, AVG_VIEWERS_PER_sTREAM,
TOTAL_FOLLOWERS, …
El lenguaje a utilizar es R, con sus librerias dpylr, ggplot2 y DT para la creación de tablas ordenadas. Este análisis cuenta con, 1. Limpieza de Datos: Carga del data frame, analizar los valores errados o inexistentes y la corrección de este tipo de datos. 2. Análisis descriptivo: Cálculo de medidas estadísticas (medias, medianas, modas, máximos, mínimos) y creación de tablas y gráficos para visualizar los datos. 3. Comparativa: Comparar los resultados obtenidos entre las dos comunidades (inglés y español) para identificar diferencias y similitudes en el comportamiento de los oyentes.
# Sustuimos los valores NA por la moda de los demás valores de esa fila
# Con esta función se encuentra la moda de una columna
moda_streamed_game <- function(v){
uniqv <- unique(v)
uniqv[which.max(tabulate(match(v, uniqv)))]}
# Encontramos la moda de la columna X2ND_MOST_STREAMED_GAME
moda_streamed_game_2 <- moda_streamed_game(twitch_data$X2ND_MOST_STREAMED_GAME)
# Reemplazamos los valores NA por la moda encontrada
data_limpia <- twitch_data %>%
replace_na(list(X2ND_MOST_STREAMED_GAME = moda_streamed_game_2))Explicación: Aquí, utilizamos la función
replace_na para reemplazar los valores NA en la columna
X2ND_MOST_STREAMED_GAME con la moda de esa columna. La
función moda_streamed_game calcula la moda de una columna
dada. Luego, aplicamos esta función para encontrar la moda de
X2ND_MOST_STREAMED_GAME.
streamers <- data_limpia %>%
group_by(LANGUAGE) %>%
count() %>%
arrange(desc(n))
datatable(streamers,
class = 'display cell-border stripe hover',
options = list(searching = FALSE),
caption = 'Tabla 1: Conteo de Streamers por Región')plotly_grafico1 <- ggplot(streamers, aes(x = reorder(LANGUAGE, n), y = n)) +
geom_bar(stat="identity", fill = palette_colours[1]) +
coord_flip() +
labs(title = "Distribución de Streamers por Región",
x = "Región",
y = "Número de Streamers") +
theme_minimal()
ggplotly(plotly_grafico1, tooltip = "text")Análisis: En la Tabla 1, podemos observar que la distribución del top 1000 streamers en Twitch son de habla angloparlante (Inglés)* con un total de 401 streamers, mientras que los de habla hispanohablante (Español) son 106. Esto indica una mayor presencia y actividad de streamers angloparlantes, aunque, el español se posiciona como la tercera lengua más popular después del Ruso (115 streamers). Esta clara diferencia sugiere un alto dominio del inglés como idioma principal para la creación de contenido en esta plataforma.
Determinamos cuáles son los streamers con más followers por región, filtramos por las dos regiones a analizar (Angloparlante e Hispanohablante).
plotly_grafico2 <- ggplot(followers_region, aes(x = reorder(NAME, TOTAL_FOLLOWERS), y = TOTAL_FOLLOWERS, fill = LANGUAGE)) +
geom_bar(stat="identity", position = "dodge") +
scale_y_continuous(labels = label_comma()) +
coord_flip() +
labs(title = "Top 5 Streamers por Followers y Región",
x = "Streamer",
y = "Total de Followers") +
scale_fill_manual(values = palette_colours) +
theme_minimal()
ggplotly(plotly_grafico2, tooltip = "text")Análisis: En la Tabla 2, observamos que el streamer con más seguidores en la comunidad angloparlante es ninja, con un total de 19,000,000 seguidores. Le sigue Auronplay, en la comunidad hispanohablante con 16,300,000 seguidores. La presencia de otros streamers como Rubius y Ibai en el top 5 hispanohablante indica una fuerte competencia y diversidad en esta región. pipipip
Determinamos cuáles son los streamers con más views por región.
plotly_grafico3 <- ggplot(views_region, aes(x = reorder(NAME, TOTAL_VIEWS), y = TOTAL_VIEWS, fill = LANGUAGE)) +
geom_bar(stat="identity", position = "dodge") +
scale_y_continuous(labels = label_comma()) +
coord_flip() +
labs(title = "Top 5 Streamers por Views y Región",
x = "Streamer",
y = "Total de Views") +
scale_fill_manual(values = palette_colours) +
theme_minimal()
ggplotly(plotly_grafico3, tooltip = "text")Análisis: En la Tabla 3, se observa que el streamer con más views de la comunidad angloparlante es ninja, con un total de 572,000,000 views. Le sigue Ibai, de la comunidad hispanohablante con 359,000,000 views. Como podemos observar, si relacionamos los Followers y las Views, Ninja sigue siendo el streamer con mayor receptividad. Mientras que, los streamers Hispanohablantes cuentan con menor cantidad de views en comparación con los angloparlantes, pero aún así, tienen una presencia significativa en la plataforma.
Determinamos cuál es el top 5 de streamers con más seguidores por el juego más streameado y región.
plotly_grafico4 <- ggplot(juego_region, aes(x = reorder(NAME, TOTAL_FOLLOWERS), y = TOTAL_FOLLOWERS, fill = MOST_STREAMED_GAME)) +
geom_bar(stat="identity", position = "dodge") +
scale_y_continuous(labels = label_comma()) +
coord_flip() +
labs(title = "Top 5 Streamers por Juego Más Streameado y Región",
x = "VideoJuegos",
y = "Total de Followers") +
scale_fill_manual(values = palette_colours) +
theme_minimal()
ggplotly(plotly_grafico4, tooltip = "text")Análisis: En la Tabla 4, se observa que en la comunidad angloparlante, los juegos más streameados por los top 5 streamers son Fortnite, Overwatch y Just Chatting. Mientras que en la comunidad hispanohablante, los juegos más populares entre los top 5 streamers son Just Chatting y Minecraft. Esto indica una clara diferencia en las preferencias de contenido entre ambas comunidades, con una mayor inclinación hacia juegos específicos en cada región. Aunque, podemos observar que Just Chatting es el juego más popular en general en las 2 comunidades, esto podemos decir que es gracias a que es una forma de hablar libremente con sus seguidores.